【CVPR】Lite-Mono_A Lightweight CNN and Transformer Architecture for Self-Supervised Monocular Depth Estimation
Lite-Mono: A Lightweight CNN and Transformer Architecture for Self-Supervised Monocular Depth Estimation
            分享人:朱颖
            研究方向:单目深度估计
            论文题目:Lite-Mono: A Lightweight CNN and Transformer Architecture for Self-Supervised Monocular Depth Estimation
            论文作者:Ning Zhang, Francesco Nex, George Vosselman, Norman Kerle
            作者单位:特文特大学
            论文摘要:不需要基准真值进行训练的自监督单目深度估计近年来引起了人们的关注。设计轻量级且有效的模型以便将它们部署在边缘设备上是非常有意义的。许多现有架构受益于使用较重的主干网,但代价是模型大小。本文通过轻量级架构取得了有竞争力的结果。具体地,本文研究了CNN和Transformer的有效组合,并提出了一种称为Lite-Mono的混合架构。本文设计了连续扩张卷积(CDC)模块和局部全局特征交互(LGFI)模块,前者用于提取丰富的多尺度局部特征,后者利用自注意力机制将远程全局信息编码到特征中。实验表明,Lite-Mono在准确率方面大幅优于Monodepth2,可训练参数减少了约 80%。相关的代码和版本可在
https://github.com/noahzn/Lite-Mono获取。
            原文链接: